
EXHIBIT 1 



anv gene from HIV-1 £11 viral strain (NCBI Accession UunSbmr K03454)) 
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ACC TCA GCC ATT ACA CAG GCT TGT CCA AAG GTA TCC TTT GAGrtCA ATT CCC ATA 648 

HYCAPjAG F A I LKCR 

^j|^^AT^G^GCC CCf, GCT GGT TTT GCG ATT CTA AAG TGT AGA 

N^G T G P C T NV S TVQ C 
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QCRIK QI IKMVAGRKAIY 
CAA TGC AGA ATA AAA CAA ATT ATA AAG ATG GTG GCA GGC AGG AAA GCA ATA TAT 
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gcc cct cct atc gaa aga aac att cta tgt tca tca aat att aca ggg cta c^a 1350 

{ltrdgg)innstnetfrfg 468 

ttg aca aga gat got ggjr ata aat aat agt act aac gag acc ttt aga cct gga 1404 

GG^DMRDNWRSELYKYKVV 486 

GGA GGA GAT ATG AGG GAC AAT TGG AGA AGT GAA TTA TAT AAA TAT AAG GTA GTA 1458 

QIEPLGVAPTRAKRRVVE 504 

CAA ATT GAA CCA CTA GGA GTA GCA CCC ACC AGG GCA AAG AGA AGA GTG GTG GAA 1512 

R E K R A I G L G A M F l/g P L G A 522 

AGA GAA AAA AGA GCA ATA GGA TTA GGA GCT ATG TTC CTTLGGG r ffH' 3 5jF$i^ GCA 1566 

agstImgarsvtltvqarq 540 

Q^A GG^AGC A?J3 ATG GGC GCA CGG TCA GTG ACG CTG ACG GTA CAG GCC AGA CAA "1620 

MSG IVQQ QNNLLRAIE A 556 

TTA ATG TCT GGT ATA GTG CAA CAG CAA AAC AAT TTG CTG AGG GCT ATA GAG. GCG 1674 

QQHLLQLTVWG 1 KQLQAR 576 

CAA CAG CAT CTG TTG CAA CTC ACG GTC TGG GGC ATT AAA CAG CTC CAG GCA AGA 1728 

SLAVERY L KDQQLLG IWG 594 

ATC CTG GCT GTG GAA AGA TAC CTA AAG GAT CAA CAG CTC CTA GGA ATT TGG GGT 1782 

C S G K H I C TTNV P WN S S WS 612 

TGC TCT GGA AAA CAC ATT TGC ACC ACT AAT GTG CCC TGG AAC TCT AGT TGG AGT 1836 

N R S ^NEIWQN M TWMEWER 630 

AAT AGA TCT CTA AAT GAG ATT TGG CAG AAC ATG ACC TGG ATG GAG TGG GAA AGA 1890 

EID NY TGLIYSLIEESQT. 648 

GAA ATT GAC AAT TAC ACA GGC TTA ATA TAT AGC TTA ATT GAG GAA TCG CAG A(JC 1944 

CqQEKNeIkELLELDKWA SL 666 

CAG CAA GAA AAG AAT GAA lAAA GAA TTG TTG GAA TTG GAC AAG TGG GCA AGT TTG 1998 

W «M W F0S i y T Q W L W Y I K I F I M 684 

TGG AAT TGG TTT AGC ATA ACA CAA TGG CTG TGG TAT ATA AAA ATA TTC ATA ATG 2052 

IIGGLIGLR IVFAVLSLV 702 

ATA ATA GGA GGC TTG ATA GGT TTA AGA ATA GTT TTT GCT GTG CTT TCT TTA GTA 2106 

NRVRQGYS PLS FQTLLPA 720 

AAT AGA GTT AGG CAG GGA TAC TCA CCT CTG TCG TTT CAG ACC CTC CTC CCA GCC 2160 

PRGP DRP EGTEEEGGERG 738 

CCG AGG GGA CCC GAC AGG CCC GAA GGA ACA GAA GAA GAA GGT GGA GAG CGA GGC 2214 

R D R S V R L L NG F S A L I W D-D 756 

AGA GAC AGA TCC GTG AGA TTG CTG AAC GGA TTC TCG GCA CTT ATC TGG GAC GAC 2268 

LRSLCLP SYHRLRDLILI 774 

CTG CGG AGC CTG TGC CTC TTC AGC TAC CAC CGC TTG AGA GAC TTA ATC TTA ATT 2322 

AVRIVELLG RRGWDILKY 792 

GCA GTG AGG ATT GTA GAA CTT CTG GGA CGC AGG GGG TGG GAC ATC CTC AAA TAT 2376 

LWNLtQY WSQELRNS ASS 810 

CTG TGG AAT CTC CTA CAG TAT TGG AGT CAG GAA CTG AGG AAC AGT GCT AGT AGC 2430 

LFD AIAIAVAEGTDRVIE 828 

TTG TTT GAT GCC ATA GCA ATA GCA GTA GCT GAG GGG ACA GAT AGA GTT ATA GAA 2484 

IIQRACRAVLNIFRRIRQ 846 

ATA ATA CAA AGA GCT TGC AGA GCT GTT CTT AAC ATA CCC AGA AGA ATA AGA CAG 2538 
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GGC TTA GAA AGG TCT TTA CTT TAA qAT GGG TGG .CAA ATG^TC ^AAA^AAQ T AG] T A 2591 

% 2591 



env gena from HIV-1 Wal vir&l strain (NCBI Accession tfuiab©r X04415) 
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MRVR EIQRNYQNWWRWG 
AUG AGA GTG AGG GAG ATA CAG AGG AAT TAT CAA AAC TGG TGG AGA TGG GGC 

MLLGMLMTC SIAEDLWV 
ATG CTC CTT GGG ATG TTG ATG ACC TGT AGT ATT GCA GAA GAT TTG TGG GTT 

VYYGVPVWKEATTTLF C 
GTT TAT TAT GGG GTA CCT GTG TGG AAA GAA GCA ACC ACT ACT CTA TTT TGT 

SDAKSYETEVHNIWATH 
TCA GAT GCT AAA TCA TAT GAA ACA GAA GTA CAT AAC ATC TGG OCT ACA CAT 

CVPTDP NPQEIELENVT 
TGT GTA CCC ACG GAC CCC AAC CCA CAA GAA ATA GAA CTG GAA AAT QTC ACA 

GFNMW KNNMVEQM HED J 
GGG TTT AAC ATG TGG AAA AAT AAC ATG GTG GAG CAG ATG CAT GAG GAT ATA 

SLW DQSLKPCVKLTPLC 
AGT TTA TGG GAT CAA AGC CTA AAA CCA TGT GTA AAG CTA ACC CCA CTC TGT 

T LNCTNVNGTAVNGTNA 
ACT TTA AAC TGC ACT AAT GTG AAT GGG ACT GCT GTG AAT GGG ACT AAT GC1 

S NRTNAELKMEIGEVKN 
AGT AAT AGG ACT AAT GCA GAA TTG AAA ATG GAA ATT GGA GAA GTG AAA AAC 

SF M I T P V G S DKR Q EYA T 
TCT TTC AAT ATA ACC CCA GTA GGA AGT GAT AAA AGG CAA GAA TAT GCA AC1 

YNLDLVQ i ddsdns s y r 

TAT AAC CTT GAT CTA GTA CAA ATA GAT GAT AGT GAT AAT AGT AGT TAT AGC 
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GCA G^l GAA GAG ATA ATG ATT AGA TCT GAA AAT CTC ACA GAC AAT ACT 
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KTLQQVAVKLGSLLNKT 
AAA ACT TTA CAA CAG GTA GCT GTA AAA CTA GGA AGC CTT CTT AAC AAA AC/ 

II FNS.C S SGGD PE l) xTH S 
ATA ATT TTT AAT TqA TCC^TC^^^ GGG ^C^CC^^j^ ATT/ ACA ACA CAC AGT 

NCRGEPyYCN TSKLPNS 
AAT TGT AGA GGG GAA TTT TTC TAC TGT AAT ACA TCA AAA CTG TTT AAT AGT ACA 
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GCT ATG TAT GCC CCT CCC ATC GCA GGA GTC ATC AAC TGT TTA TCA AAT ATT ACA 1350 



4f L T R D G g) N S S D N S D N E 468 
A TTA ACA AGA GAT GGT GOfi AAT AGT AGT GAC AAT AGT GAC AAT GAG 1404 
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ACC TTA AGA CCT GGA GGA GGA GAT ATG AGG GAC AAT TGG ATA AGT GAA TTA TAT 1458 



KYKV VR I EPLGVAPTKAK 504 

AAA TAT AAA GTA GTA AGA ATT GAA CCC CTA GGA GTA GCA CCC ACC AAG GCA AAG 1512 

RRVVEREKR AIGLGAMFL 522 

AGA AGA GTG GTG GAA AGA GAA AAA AGA GCA ATA GGA CTA GGA GCC ATG TTC CTT 1566 

-/g FLGAAGSt)mGAA5L. TLT .540 

|jbGG TTCj TT^,C^ GCA^p^^ AGC AjjG ATG GGC GCA GCG TCA CTA ACG CTG ACG 1620 

VQ^RQffLSGIVQQQNN L L 558 

GTA CAG GCC AGA CAG TTA CTG TCT GGT ATA GTG CAA CAG CAA AAC AAT TTG CTG 1674 

RAIEAQQHLLQLTV .WGIK 576 

AGG GCT ATA GAG GCG CAA CAG CAT CTG TTG CAA CTC ACG GTC TGG GGC ATT AAA 1720 

QLQARVLAVERYLQDQR L 594 

CAG CTC CAG GCA AGA GTC CTG GCT GTG GAA AGA TAC CTA CAG GAT CAA CGG CTC 1762 

LGMWGC SGKHI CT T F V P W 612 

CTA GGA ATG TGG GGT TGC TCT GGA AAA CAC ATT TGC ACC ACA TTT GTG CCT TGG 1036 

N S S W S N R S L D D I W N N M T W 630 

AAC TCT AGT TGG AGT AAT AGA TCT CTA GAT GAC ATT TGG AAT AAT ATG ACC TGG 1890 

MQWEK E I SNYTGI I Y N L I 648 

ATG CAG TGG GAA AAA GAA ATT AGC AAT TAC ACA GGC ATA ATA TAC AAC TTA ATT 1944 

E E S Q I. (q Q E K N eL K E L L E L D 666 

GAA GAA TCG CAA A^^AC^A^ GA^U^^j^GAAJ AAG GAA TTA TTG GAA TTG GAC 1998 
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aag tgg gca agt ttg tgg aat tgg ttt agc ata tca aaa tgg ctg tgg tat ata 2052 

rifiivvggliglrii fa 702 

aga ata ttc ata ata gta gta gga ggc tta ata ggt tta aga ata att ttt gct 2106 

vlslvnrvrqgysplslq 720 

gtg ctt tct tta gta aat aga gtt agg cag gga tac tca cct ctg tcg ttg cag 2160 

TLLPTFRGPPDRPEGX.ee 738 

ACC CTC CTC CCA ACA CCG AGG GGA CCA CCC GAC AGG CCC GAA GGA ATA GAA GAA 2214 

EGGEQ GR GRS I RLVNGFS 756 

GAA GGT GGA GAG CAA GGC AGA GGC AGA TCA ATT CGA TTG GTG AAC GGA TTC TCA 2268 

ALIWDPLRNL CLFSYHRL 774 

GCA CTT ATC TGG GAC GAC CTG AGG AAC CTG TGC CTC TTC AGT TAC CAC CGC TTG 2322 

RDLL LIATRIV ELLGRR G 792 

AGA GAC TTA CTC TTA ATT GCA ACG AGG ATT GTG GAA CTT CTG GGA CGC AGG GGG 2376 

WEALKYLWNLLQYWGQEL 810 

TGG GAA GCC CTC AAA TAT CTG TGG AAT CTC CTG CAA TAT TGG GGT CAG GAA CTG 2430 

XNSAISLLNTTAIAVAE C 828 

AAG AAT AGT GCT ATT AGC TTG CTT AAT ACC ACA GCA ATA GCA GTA GCT GAA TGC 2484 
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ACA GAT AGG GTT ATA GAA ATA GGA CAA AGA TTT GGT AGA GCT ATT CTC CAC ATA 2538 
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CCT AGA AGA ATT AGA CAG GGC TTC GAA AGG GCT TTG CTA TAA CAT GGG TGG CAA 2592 

V V K PC) * -i H * 670 
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env gene from HXV-1 Bru viral e train (KCBI Accession Nusibex K02013) 
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GSDTITLPCRI K Q F I N M W 
GGA AGT GAC ACA ATC ACA CTC CCA TGC AGA ATA AAA CAA TTT ATA AAC ATG TGG 
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cag gaa gta gga aaa gca atg tat gcc cct ccc atc agc gqa caa att aga tgt 1350 

ssni tgll(ltr£>g§Jnnnn 46$ 

tca tca aat att aca ggg ctg cga tta aca^ i|ga^t ^ ggt g^t aat aac aac aat 1404 

g s e iprpggg^mrd nwrs 486 

ggg tcc gag atc ttc aga cct gga gga gga gat atg agc gac aat tgg aga agt 1458 

elyk ykvvk iepl gva ft 504 

gaa tta tat aaa tat aaa gta gta aaa att gaa cca tta gga gta gca ccc acc 1512 

kak rrvvqrekravgi g a 522 

aag gca aag aga aga gtg gtg cag aga gaa aaa aga gca gtg gga ata gga gct 1566 

L F L _(g F L G A A G S x)m G A R S M .540 

TTG TTC CTT[j3GG TTC^ TT^^A GCA^^C^G^A^AGC Agfr ATG GGC GCA CGG TCA ATG 1620 

T L T V Q *b R Q £ L S G.I V Q Q Q N 558 

ACG CTG ACG GTA CAG GCC AGA CAA TTA TTG TCT GGT ATA GTG CAG CAG CAG AAC 1674 

NLLKA I EAQQHLLQ LTVW 576 

AAT TTG CTG AGG GCT ATT GAG GCG CAA CAG CAT CTG TTG CAA CTC ACA GTC TGG 1728 

GIKQLQARILAVERYLKD 594 

GGC ATC AAG CAG CTC CAG GCA AGA ATC CTG GCT GTG GAA AGA TAC CTA AAG GAT 1762 

QQL LG I WGC S G K L I C T T A 612 

CAA CAG CTC CTG GGG ATT TGG GGT TQC TCT GGA AAA CTC ATT TGC ACC ACT GCT 1636 

V P W N A S W S N K S L E .Q I W N N 630 

GTG CCT TGG AAT GCT AGT TGG AGT AAT AAA TCT CTG GAA CAG ATT TGG AAT AAC 1890 

MTWMEWDRE INN'YT SL I H 648 

ATG ACC TGG ATG GAG TGG GAC AGA GAA ATT AAC AAT TAC ACA AGC TTA ATA CAT 1944 

S L I E E S Q *L CQ Q E K N eL Q E L L 666 

TCC TTA ATT GAA GAA TCG CAA AS£ CAG CA^Gi^^G AJj^ G^CA^<jAA TTA TTG 1996 

E L D K W A S L W N^W F N^I^T N. W L 684 

GAA TTA GAT AAA TGG GCA AGT TTG TGG AAT TGG TTT AAC ATA ACA AAT TGG CTG 2052 

WYIKIFIMIVGGLVGLRI 702 

TGG TAT ATA AAA ATA TTC ATA ATG ATA GTA GGA GGC TTG GTA GGT TTA AGA ATA 2106 

VFAVLSIV N RVRQ GYS PL 720 

GTT TTT GCT GTA CTT TCT ATA GTG AAT AGA GTT AGG CAG GGA TAT TCA CCA TTA 2160 

SF Q TH L P T P RG PD Rf E G I 738 

TCG TTT CAG ACC CAC CTC CCA ACC CCG AGG GGA CCC GAC AGG CCC GAA GGA ATA 2214 

EEEGGERDR DRS IRLVNG 756 

GAA GAA GAA GGT GGA GAG AGA GAC AGA GAC AGA TCC ATT CGA TTA GTG AAC GGA 2268 

SLALIWDPLR SLCLFSY H 774 

TCC TTA GCA CTT ATC TGG GAC GAT CTG CGG AGC CTG TGC CTC TTC AGC TAC CAC 2322 

RLRD LLL I V TR IV ELL GH 792 

CGC TTG AGA GAC TTA CTC TTG ATT GTA ACG AGG ATT GTG GAA CTT CTG GGA CGC 2376 

RGWEALKYWWNLLQYWSQ 810 

AGG GGG TGG GAA GCC CTC AAA TAT TGG TGG AAT CTC CTA CAG TAT TGG AGT CAG 2430 

ELKNSAVSLLNATAIAVA 828 

GAA CTA AAG AAT AGT GCT GTT AGC TTG CTC AAT GCC ACA GCC ATA GCA GTA GCT . 2484 

EG T D R V I E V V Q G A C R A . I R 846 

GAG GGG ACA GAT AGG GTT ATA GAA GTA GTA CAA GGA GCT TGT AGA GCT ATT CGC 2538 

H.IPKRIRQ'GLERILL*J)(q 864 

. CAC ATA CCT AGA AGA ATA AGA CAG GGC TTG GAA AGG ATT TTG CTA TAA C^AT GGG 2592 

W Q V V K k) * ^ C 872 

TGG CAA GTG, GTC AAA AAG TAGJtGT GG 2618 



env gene from HXV-1 Z2 vir 1 strain (RCBX Accession Number H22639) 
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R G IERNC QNLWKWG I IS 

\GG GGG ATA GAG AGG AAT TGT CAA AAC TTG TGG AAA TGG GGC ATC 54 

GILMTCSNADNLWVT 36 

3GG ATA TTG ATG ACC TGT AGT AAT GCA GAC AAT CTG TGG GTC ACA 108 

GVPVWKEATTTL FCA 54 

SGG GTG CCT GTA TGG AAG GAA GCA ACC ACC ACT CTA TTT TGT GCA 162 

KSYKTEAHNIWATHA 72 

bAA TCA TAT AAA ACA GAG GCA CAT AAT ATC TGG GCC ACA CAT GCC 216 

TDPMPQEIELENVTE 90 

fcCG GAC CCC AAC CCA CAA GAA ATA GAA CTG GAA AAT GTG ACA GAA 270 

MWRNW-MVEQMHBDII.108 

VTG TGG AGA AAT AAC ATG GTG GAA CAG ATG CAT GAG GAT ATA ATC 324 

DQ SLKPCVKLTPLCV 126 

SAT CAA AGC CTA AAA CCA TGT GTA AAA TTA ACC CCA CTC TGT GTC 376 

CI'DEVMENVTMKNNN 144 

TGC ATA GAT GAA GTG ATG GAG AAT GTC ACA ATG AAG AAT AAT AAT 432 

KIRMKWCSPNITTVV 162 

SAA ATA AGA ATG AAA AAC TGC TCT TTC AAT ATA ACT ACA GTA GTA 486 

T K QVHALFY RLD IVP 180 

ACA AAA CAA GTA CAT GCA CTT TTT TAT AGA CTT GAT ATA GTA CCC 540 

DNSTNS TNY RL I NCN 198 

GAT AAT AGT ACC AAT AGT ACC AAT TAT AGA TTA ATA AAT TGT AAT 594 



J(C< 



I 516 
ATA 646 



AG PAILKCRDWRF 234 

GCT GGT TTT GCA ATT CTA AAA TGT AGA GAT AAA AGG TTC 702 

G P C T NV S TV Q C T HG1 252 

3GC CCA TGC ACA AAT GTC AGC ACA GTA CAA TGT ACA CAT GGA ATT 756 

V S T Q L L L X N G S L A §) E E 270 

3TG TCA ACT CAA CTG CTG TTGlAAT GGC AGT CTA GCA Gfifc GAA GAG 810 

RSENliTNN&KlIIVQ 268 

\GA TCT GAA AAC CTC ACA AAC AAT GCT AAA ATC ATA ATA GTA CAG 864 

SVA I NCTRP YRN IRQ 306 

fCT GTA GCA ATT AAC TGT ACA AGG CCC TAC AGA AAT ATA AGA CAA 918 

IGLG QAL YTTKTRSI 324 

\TA GGA TTA GGG CAA GCG CTC TAT ACA ACA AAA ACA AGA AGT ATA 972 

AYCN I SKNEWNKTLQ 342 

ATA GGA CAA GCA TAT TGT AAT ATT AGT AAA AAT GAA TGG AAT AAG ACA TTA CAA 1026 

QVAIKLGNLLNKTTI I F K 360 

CAG GTA GCT ATA AAA TTA GGA AAC CTT CTT AAC AAA ACA ACA ATA ATT TTT AAA 1080 



E.fsSGGDPElk 
F 4r C W T S G 



TTHSFNCGG 378 
ACA ACA CAC AGT TTT AAT TGT GGA GGG 1134 



E f p 4r C W T S G L F N S T W D I S 396 

GAA TTC TTC TAC TGT AAT ACA TCA GGA CTG TTT AAT AGT ACA TGG GAT ATT AGT 1188 

KS EWANSTESDDKPITLQ 414 

AAA TCA GAA TGG GCT AAT AGT ACA GAG TCA GAT GAT AAA CCA ATC ACA CTC CAA 1242 

n x> t tr a t t k m w n n v c; K AMY 432 
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AGA GAA AAA AGA GCA ATA GGA CTA GGA GCT ATG TTC CTT EGG ^TC 'TTG GGA GC^ /-Jv56S 



AGS "nM G A R S X/ T L T V Q<J A ' R Q '540 
GCA GGA AGC A* ATG GGC GCA CGG TCA TTG ACG CTG ACG GTA CAG GCC AGA CAG 1620 



V QQ A R Kk 5 




L L S G IV Q Q QNNLL RA I E.A 556 

TTA TTG TCT GGT ATA GTG CAA CAG CAA AAC AAT TTG CTG AGG GCT ATA GAG GCG 1674 

QQHLLQLTVWGIK QLQ AR 576 

CAA CAG CAT CTG TTG CAA CTC ACG GTC TGG GGC ATT AAA CAG CTC CAG GCA AGA 1728 

ILAVERYLKDQQLLGIWG 594 

ATC CTG GCT GTA GAG AGA TAC CTA AAG GAT CAA CAG CTC CTA GGA ATT TGG GGT 1782 

CSGK LICTTTVPWNSSWS 612 

TGC TCT GGA AAA CTC ATT TGC ACC ACT ACT GTG CCC TGG AAC TCT AGT TGG AGT 1836 

NRSLNDIW QNMTWMEWER 630 

AAT AGA TCT CTA AAT GAC ATT TGG CAG AAC ATG ACC TGG ATG GAG TOG GAA AGA 1990 

E I D NY T G L I Y R L I E E S Q X 648 

GAA ATT GAC AAT TAC ACA GGC TTA ATA TAT AGA TTA ATT GAA GAA TCG CAA A<JC 1944 

LELDKWASL 666 

TTG GAA TTG GAC AAG TGG GCA AGT TTG 1998 

L WYIK IFIM 684 

CTG TGG TAT ATA AAA ATA TTC ATA ATG 2052 

IV GGL I G LR IVFAVL S L V 702 

ATA GTA GGA GGC TTG ATA GGT TTA AGA ATA GTT TTT GCT GTG CTT TCT TTA GTA 2106 

NRVRQGYS PLSF QTLLPA 720 

AAT AGA GTT AGG CAG GGA TAT TCA CCT CTG TCA TTT CAG ACC CTC CTC CCA GCC 2160 

PRGPDRPEGIEEEGGE R G 738 

CCG AGG GGA CCC GAC AGG CCC GAA GGA ATA GAA GAA GAA GGT GGA GAG CGA GGC 2214 

RDRSIRLV NGFSALIWDD 756 

AGA GAC AGA TCC ATT CGA TTG GTG AAC GGA TTC TCA GCA CTT ATC TGG GAC GAT 2266 

LRN LC LFSYHRLRDLILI 774 

CTG AGG AAC CTG TGC CTC TTC AGC TAC CAC CGC TTG AGA GAC TTA ATC TTA ATT 2322 

AARIVELLGRRGWEALKY 792 

GCA GCG AGG ATT GTG GAG CTT CTG GGA CGC AGG GGG TGG GAA GCC CTC AAA TAT 2376 

LWNLLQYWSRELKNSASS 810 

CTG TGG AAT CTC CTA CAG TAT TGG AGT CGG GAA CTG AAG AAC AGT GCT AGT AGC 2430 

LLDTIAIAVAEGTDRVIE 828 

TTG CTT GAT ACC ATA GCA ATA GCA GTA GCT GAG GGG ACA GAT AGG GTT ATA GAA 2484 

IV RR ACRAVLHIPTRI R Q 046 

ATA GTA CGA AGA GCT TGC AGA GCT GTT CTT CAC ATA CCC ACA AGA ATA AGA CAG 2538 

GLERLLL *-h(gWQ MVKk)***Y 864 

GGC TTA GAA AGG CTT TTG CTT TAA dAT GGG TGG. CAG ATG GTC AAA AAG TAG] TAT 2592 

S . « » C V K 

AGT TGG ATG GCC TGC TAT AAG G 2614 



env gone fxom hxv-1 AKV-2 strain (NCBI Accession number K02007) 



MKVKGT RRNYQHLWRWGT 19 

ATG AAA GTC AAG GGG ACC AGG AGG AAT TAT CAG CAC TTG TGG AGA TGG GGC ACC 54 

LLLGMLMICSAT EK LWVT 36 

TTG CTC CTT GGG ATG TTG ATG ATC TGT AGT GCT ACA GAA AAA TTG TGG GTC ACA 108 

VYYGVFVWXBATTTLFCA 54 

GTT TAT TAT GGA GTA CCT GTG TGG AAA GAA GCA ACT ACC ACT CTA TTT TGT GCA 162 

S D A R A Y D T EVHNVWA T HA 72 

TCA GAT GCT AGA GCA TAT GAT ACA GAG GTA CAT AAT GTT TGG GCC ACA CAT GCC 216 

CVPTDPNPQEVVLGtfVTE 90 

TGT GTA CCC ACA GAC CCC AAC CCA CAA GAA GTA GTA TTG GGA AAT GTG ACA GAA 270 

NFNMWKNNMVEQMQ E D I I 108 

AAT TTT AAC ATG TGG AAA AAT AAC ATG GTA GAA CAG ATG CAG GAG GAT ATA ATC 324 

SLWDQSLKPCVKLTPLCV 126 

AGT TTA TGG GAT CAA AGC CTA AAG CCA TGT GTA AAA TTA ACC CCA CTC TGT GTT 378 

TLNCTDLGKATNTNSS NW 144 

ACT TTA AAT TGC ACT GAT TTG GGG AAG GCT ACT AAT ACC AAT AGT AGT AAT TGG 432 

KEE I KG E IKNC S F N I T T S 162 

AAA GAA GAA ATA AAA GGA GAA ATA AAA AAC TGC TCT TTC AAT ATC ACC ACA AGC 4$6 

IRDKIQKENA LFRNL DVV 180 

ATA AGA GAT AAG ATT CAG AAA GAA AAT GCA CTT TTT CGT AAC CTT GAT GTA GTA 540 

PIDNAS T TTNYTNYRt I H 198 

CCA ATA GAT AAT GCT AGT ACT ACT ACC AAC TAT ACC AAC TAT AGG TTG ATA CAT 594 



CNRSVI TQACFKVSFE ( P I 216 
TGT AAC AGA TCA GTC ATT ACA CAG GCC TGT CCA AAG GTA TCA TTT GAG ICC A ATT 648 



ATA CAT TAT 1 



PIHYCTeJaGFAILKCN N ^K"' 7 234 
CCC AT£ CAT jTAT, TGT ACC COG GCT GGT TTT GCG ATT CTA AAG TGT AAT AAT AAA 702 



3 ret 



TFflNG KG p ctnvstvqcth 252 

ACG TTC AAT GGA AAA GGA CCA TGT ACA AAT GTC AGC ACA GTA CAA TGT ACA CAT 756 

GIRPIVSTQLLlJlNG S LA^ 270 

GGA ATT AGG CCA ATA GTG TCA ACT CAA CTG CTG TTAJAAT ^j^^^j"™ GCA 610 



EEV V1 R S DNF TNN aQ K T I I 268 

GAA GAG GTA GTA ATT AGA TCT GAC AAT TTC ACG AAC AAT GCT AAA ACC ATA ATA 864 

VQLNESVAINCTR PN NNT 306 

GTA CAG CTG AAT GAA TCT GTA GCA ATT AAC TGT ACA AGA CCC AAC AAC AAT ACA 918 

RKSIYIGFGRAFHTTGRI 324 

AGA AAA AGT ATC TAT ATA GGA CCA GGG AGA GCA TTT CAT ACA ACA GGA AGA ATA 972 

IGDIRKAHC.MISRAQWNN 342 

ATA GGA GAT ATA AGA AAA GCA CAT TGT AAC ATT AGT AGA GCA CAA TGG AAT AAC 1026 

TLBQIVKKL REQPGNNKT 360 

ACT TTA GAA CAG ATA GTT AAA AAA TTA AGA GAA CAG TTT GGG AAT AAT AAA ACA 1080 

I V F N Q- (s SGGDPElLvMH SF 376 

ATA GTC TTT AAT cJ^A TCC ^AGg^ GG^ <^A{^ C<j^ ^A ATT] GTA ATG CAC AGT TTT 1134 

NCRGEF F^YCHTTQLFWNT 396 

AAT TGT AGA GGG GAA TTT TTC TAC TGT AAT ACA ACA CAA CTG TTT AAT AAT ACA 1188 

WRLNHTEGTKGNDT IILP 414 

TGG AGG TTA AAT CAC ACT GAA GGA ACT AAA GGA AAT GAC ACA ATC ATA CTC CCA 1242 



CRIK QT INM WQEVGKAMY 
TGT AGA ATA AAA CAA ATT ATA AAC ATG TGG CAG GAA GTA GGA AAA GCA ATG TAT 



432 
1296 



GCC CCT CCC ATT GGA GGA CAA ATT AGT TGT TCA TCA AAT ATT ACA GGG CTG t^TA 1350 



fh T R D G q) 

1TA ACA AGA GAT GGT GOT 



TNVTNDTEVFRP 468 

ACA AAT GTA ACT AAT GAC ACC GAG GTC TTC AGA CCT 1404 

DMRDNWRS E L Y K Y K V 486 

GGA GGA GGA GAT ATG AGG GAC AAT TGG AGA AGT GAA TTA TAT AAA TAT AAA GTA 1*58 



IKIEPLGIAPTKAKRRV V 504 

ATA AAA ATT GAA CCA TTA GGA ATA GCA CCC ACC AAG GCA AAG AGA AGA GTG GTG 1512 

QRE KRAVGIVGAMFI/ Jfi P L 522 
CAG AGA GAA AAA AGA GCA GTG GGA ATA GTA GGA GCT ATG TTC CTT^GGG TjTC 5TOq i 1566 

GA A G S 3j M G A V S L T L T V Q<J A 540 

GG^fC^ G^A GGA AGC AgP ATG GGC GCA GTG TCA TTG ACG CTG ACG GTA CAG GCC 1620 

R^^L L S G.I VQQQNW L L R A X 558 

AGA CAA TTA TTG TCT GGT ATA GTG CAA CAG CAG AAC AAT TTG CTG AGG GCT ATT 1674 

EAQ Q H L L Q LTV.WG I K Q L Q 576 

GAG GCG CAA CAA CAT CTG TTG CAA CTC ACA GTC TGG GGC ATC AAG CAG CTC CAG 1728 

ARVLAVERYIiRDQQLLGI 594 

GCA AGA GTC CTG GCT GTG GAA AGA TAC CTA AGO GAT CAA CAG CTC CTA GGG ATT 1782 

WGCSGKL ICT TAVP WMAS 612 

TGG GGT TGC TCT GGA AAA CTC ATT TGC ACC ACT GCT GTG CCT TGG AAT GCT AGT 1836 

WSNKSLEDIW DNMTWMQW 630 

TGG AGT AAT AAA TCT CTG GAA GAC ATT TGG GAT AAC ATG ACC TGG ATG CAG TGG 1890 

EREIDNY TNT tVTLLEES 648 

GAA AGA GAA ATT GAC AAT TAC ACA AAC ACA ATA TAC ACC TTA CTT GAA GAA TCG 1944 

Q *i.(Q Q E K N EA. Q E L L E L D K W A 666 

CAG a3^C CAA CAA AAG A^T ^Ajg^jGAA TTA TTA GAA TTG GAT AAG TGG GCA 1998 

S L W W ^ F 1°" T N W L W Y I K I F 684 

AGT TTG TGG AAT TGG TTT AGC ATA ACA AAC TGG CTG TGG TAT ATA AAG ATA TTC 2052 

I M I V G G L V G L R I V F A - V L S 702 

ATA ATG ATA GTA GGA GGC TTG GTA GGT TTA AGA ATA GTT TTT GCT GTG CTT TCT 2106 

IVNRVRQGYSPLSF QT RL 720 

ATA GTG AAT AGA GTT AGG CAG GGA TAC TCA CCA TTG TCA TTT CAG ACC CGC CTC 2160 

PV P R G P D R PD G I E E E G G E 738 

CCA GTC CCG AGG GGA CCC GAC AGG CCC GAC GGA ATC GAA GAA GAA GGT GGA GAG 2214 

R DRD RSVRLVDGFLAL I W 756 

AGA GAC AGA GAC AGA TCC GTT CGA TTA GTG GAT GGA TTC TTA GCA CTT ATC TGG 2268 

EDLRSLCLFSYRRLRDLL 774 

GAA GAT CTG CGG AGC CTG TGC CTC TTC AGC TAC CGC CGC TTG AGA GAC TTA CTC 2322 

LIAA RTV EI LGHRGWEAL 792 

TTG ATT GCA GCG AGG ACT GTG GAA ATT CTG GGG CAC AGG GGG TGG GAA GCC CTC 2376 

KYWWSli l^ QYW 1 QELKN S A BIO 

AAA TAT TGG TGG AGT CTC CTG CAG TAT TGG ATT CAG GAA CTA AAG AAT AGT GCT 2430 

VS WL NAT A I AVTEG TDRV 828 

GTT AGC TGG CTC AAC GCC ACA GCT ATA GCA GTA ACT GAG GGG ACA GAT AGG GTT 2 4 84 

IE VAQRAYRAILHIHRRI 046 

ATA GAA GTA GCA CAA AGA GCT TAT AGA GCT ATT CTC CAC ATA CAT AGA AGA ATT 2536 

RQ.GLERLLL*jD (g W Q V V X t) 864 
AGA CAG GGC TTG GAA AGG CTT TTG CTA TAA OjAT GGG a ^^S^^? TG ^^^^^(jft^) 2592 

- Y G W M <J ^ ' B69 

TAGjTAT GGG TGG ATG G 2608 



